一 种 基于 全 天 相机 云图 的 云 量 测 量 指标 ” 
张 雨 昕 1，, 印 波 1, AEAT, FARI, 相 冠 杰 C 
( 1. 河 北 工业 大 学 ， 天 津 300401 ) 
摘要 : 全 天 相机 云图 是 天 文 界 监测 云 量 的 重要 手段 , 但 没有 确定 的 云 量 计算 指标 。 因 此 本 文 


提出 了 一 种 新 的 云 量 测量 量化 指标 一 一 云 分 布 密度 ,并 基于 该 指标 建立 全 天 相机 云图 自动 分 


类 系统 。 首 先 ， 对 云图 进行 去 噪 ， 利 用 Otsu 算法 分 割 云 区 域 ; 然后 对 去 除 背 景 的 云 区 域 图 
像 使 用 本 文 提出 的 云 分 布 密度 计算 云 量 ; 最 后 使 用 四 种 传统 的 分 类 器 ( 支持 向 量 机 , K 最 近 
邻 ， 决 策 树 和 随机 森林 ) 根据 计算 数值 进行 自动 分 类 并 评估 各 分 类 器 的 性 能 。 结 果 表 明 ,本 
文 提出 的 云 分 布 密度 可 作为 评判 全 天 相机 云图 云 量 的 数值 指标 ;基于 云 分 布 密度 建立 的 云图 
自动 分 类 系统 实现 了 较 高 的 识别 准确 率 ,其 中 随机 森林 法 得 到 了 最 好 的 分 类 效果 一 一 各 类 云 
图 的 识别 准确 率 均 达 到 95% 以 上 。 

关键 字 : 云 分 布 密度 ,全 天 相机 云图 , TMT ， 云 量 测量 


中 图 分 类 号 : P412.15 


0 引言 
全 天 相机 上品 拍 摄 的 云图 是 目前 天 文 台 判 别 地 球 大 气 条 件 的 重要 依据 ,是 天 文 观 测 工作 不 
可 缺少 的 重要 工具 , 特别 是 在 天 文 台 的 选 址 工作 中 至 关 重 要 , 而 云 量 是 全 天 相机 云图 反映 的 
云 的 重要 信息 之 一 。 云 量 指 的 是 特定 类 型 的 云 (部 分 云 量 ) 或 全 部 类 型 的 云 (总 云 量 ) 覆盖 
天 空 的 估计 比例 , 目前 对 于 云 量 计算 的 研究 大 部 分 是 基于 云 检测 来 实现 的 , 一 类 是 根据 云 点 
与 总 像 元 点 之 间 的 比值 来 计算 云 量 。 比 如 国际 卫星 测 云气 候 学 计划 (ISCCP) 根据 像 元 辐射 
值 与 晴空 辐射 之 间 的 关系 ,判断 像 元 是 云 点 还 是 非 云 点 外。 阅 值 法 根据 天 空 与 云 的 红 葛 波段 
HAM AT, AEBS. A AGE BA, Je RED PE zz ETT HIT. REDE 
SRA IN AMES — BY BE zs BE (CLAVR-1) PARREIRA 将 像 元 分 为 无 云 、 混 合 和 有 云 三 类 ; 中 等 
分 辩 率 成 像 光谱 仪 云 量 算法 (MODIS) 中 将 像 元 分 为 确定 云 、 可 能 云 、 可 能 晴空 、 上 晴空 四 类 。 
此 外 还 有 超 高 分 辨 率 辐射 仪 拓 展 云 量 算法 (CLAVR-X) 中， 高 分 辩 率 红外 测 深 仪 云 量 算法 
(HIRS) "方法 等 。 但 是 它们 都 是 将 像 元 分 为 有 限 的 儿 个 类 别 ， 做 一 个 定性 的 分 析 ， 这 无 
疑 是 很 粗糙 的 。 此 外 还 有 基于 特征 的 云 检 测 分 类 算法 的 研究 如 随机 森林 、 支 持 向 量 机 、 贝 叶 
斯 分 类 器 四、K-meanst++ 小 、 神 经 网 络 10 等 ， 主 要 基于 颜色 1 或 纹理 特征 1 进行 云 区 域 分 
割 。 近 年 来 深度 学 习 也 在 云 检 测 领 域 得 到 了 广泛 应 用 ,比如 一 种 基于 深度 残 差 全 卷 积 网 络 0 
的 云 检测 方法 实现 了 对 遥感 影像 云层 目标 像素 级 别 的 分 制 ， 像 素 精度 达到 了 93.33%; 还 有 
种 基于 带 权重 的 多 尺度 融合 分 割 网 络 的 遥感 云图 云 检测 方法 "， 其 像素 精度 可 达 95.39%; 


*; 基金 项 目 : 国家 自然 科学 天 文联 合 基金 (U1931134) 资 助 . 
作者 简介 : 张 雨 听 ， 女 ， 硕 士 ， 研 究 方向 ;机 器 视觉 与 模式 识别 。 
通讯 作者 : 邱 波 ， 男 ， 教 授 ， 研 究 方向 : 模式 识别 。 
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某 改进 的 全 卷 积 神经 网 络 实现 了 日 间 地 基 云 图 和 夜间 地 基 云 图 的 云 区 域 分 割 "像素 精度 


达到 了 94.59% 。 另 一 类 就 是 根据 像 元 辐射 量 与 反射 率 的 比值 来 计算 等 效 云 量 ， 但 是 其 仅仅 


是 对 云 覆 盖 面 积 的 一 个 反应 。 


因此 无 论 是 云 量 还 是 等 效 云 量 , 现 阶段 云 量 的 研究 仅仅 关注 于 云层 的 覆盖 面积 而 忽略 了 


云 的 分 布 密集 程度 。 

目前 天 文 台 的 云 量 观测 是 使 用 30 米 口径 望远镜 
(Thirty Meters Telescope, TMT) 中 用 到 的 人 工 判读 云 
法 : 分 别 在 天 顶 距 44.7* 和 65° 处 画 圆 (在 图 1 中 用 蓝 色 
和 绿色 标注 ), 将 全 天 云 量 分 为 Clear( 外 圈 以 内 无 云 ) 、 

Covered〈 外 圈 以 内 厚 云 覆盖 超过 50%) . Inner CAS] 

有 云 ) Outer (Aca, SABA RZ TREE zx 四 类 。 


图 1 全 天 相机 云图 区 域 划 分 


Fig. 1. Division of ASI image region. 
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本 质 上 来 说 ，TMT 方法 主要 是 基于 ASI 图 像 中 云 区 域 的 比例 来 测量 云 量 ， 对 云 分 布 的 密集 
程度 考虑 不 够 充分 ， 并 且 没 有 直观 可 靠 的 定量 指标 。 

针对 上 述 问 题 ， 本 文 提 出 了 一 种 新 的 云 量 测量 指标 云 分 布 密度 (Cloud Distribution 
Density of ASI Images, ASICDD) ， 用 于 描述 围绕 云图 中 心 点 的 全 天 云 量 的 分 布 情况 。 本 文 
的 主要 创新 点 有 : CD 将 云 点 与 云图 中 心 点 之 间 的 距离 变量 引入 云 量 计算 中 ， 定 义 了 云 分 
布 密度 的 计算 模型 ，(2) 重新 定义 云 面 积 的 计算 模型 ， 引 入 云层 厚度 变量 ; G) 提出 了 一 
种 基于 云 分 布 密度 和 云 面 积 的 云图 自动 分 类 系统 ， 使 用 四 种 传统 分 类 算法 〈 决 策 树 ，KNN， 
SVM 和 随机 森林 ) 并 选取 1511 张 云 图 数据 进行 实验 分 析 。 结 果 表 明 ， 随 机 森林 CRE) 的 
分 类 结果 是 最 好 的 ， 并 且 在 各 种 类 型 中 具有 很 高 的 识别 精度 。 

本 文 使 用 的 云图 数据 来 源 于 中 国 科 学 院 国 家 天 文 台 光学 天 文学 重点 实验 室 ， 大 小 为 
1411x1411 像素 。 数 据 集中 包含 1511 张 全 天 相机 云图 ， 包 括 295 张 Clear，696 张 Covered, 
277 张 Inner 和 243 张 Outer。 

1 云 分 布 密度 的 定义 
1.1 云 分 布 密度 计算 模型 

云 分 布 密度 的 提出 主要 是 为 了 说 明 云 区 域 距 云图 中 心 的 远近 对 天 文 观测 结果 的 不 同 影 
响 ， 距 离 中心 越 近 ， 影 响 越 大 ， 反 之 则 越 小 。 云 分 布 密度 就 是 对 这 种 影响 进行 量化 表示 。 云 
分 布 密度 有 三 个 决定 要 素 : 面积 、 厚 度 和 距 云 图 中 心 点 的 距离 。 在 归 一 化 处 理 后 的 云 区 域 灰 
n, 度 图 的 基础 上 ， 将 云 区 域 划 分 为 N 个 单位 云 区域 x; (i=1,2,.….,N) ，xi 的 面积 为 5;， 平 均 云层 
c 厚度 为 w， 云 区 域 中 心 点 距 云 图 中 心 点 的 距离 为 d;， 一 张 ASI 的 云 分 布 密度 公式 可 如 下 表 


he V i 
Ly Ww i 


A 


"^ 


e 
e 示 : 
N 
ASICDD = * sw, f (d;) (D 
i=l 
其 中 f 是 以 di 为 自 变 量 的 云 区 域 的 分 布 密度 函数 。 由 于 设备 和 裁剪 的 问题 ,距离 参数 不 是 看 


定 的 ， 因此 取 相 对 距离 dd =d, ,/R ， 其 中 R 表示 ASI 有 效 区 域 半径 。 


云 分 布 密度 主要 探究 的 是 寻找 合适 的 函数 来 表达 云 区 域 距 云 图 中 心 点 距离 大 小 的 影响 。 
根据 云 分 布 密度 的 定义 , 相同 面积 大 小 的 云 区 域 距 离 中 心 点 越 近 对 观测 影响 越 大 , 则 定义 式 
(1) 中 的 距离 分 布 函数 上 是 随 di 递减 的 函数 ， 在 云图 中 心 点 分 布 密度 最 大 。 由 于 本 文 对 全 
天 相机 云图 的 分 类 是 基于 TMT 的 判断 标准 ， 则 在 参数 设 定 上 考虑 内 圈 和 外 圈 的 影响 。 经 过 
多 次 试验 和 与 人 工 观测 的 结果 对 比 研 究 , 人 为 设 定 云 图 中 心 点 处 分 布 密度 为 1, 内 圈 处 为 0.7， 
外 圈 处 为 0， 经 MATLAB 曲线 拟 合 工 具 箱 线性 拟 合 后 /如 图 2 所 示 ， 公 式 表 达 如 式 (2) ， 
其 中 正弦 项 是 为 了 修正 拟 合 的 二 次 函数 ， 使 其 满足 递减 条 件 。 


f (d; ) » 22433sin(d; —)+1.228(d, -10)? -121.8 (2) 


在 实际 运算 中 ， 本 文 以 每 个 像素 点 为 计算 单位 ， 可 使 ASICDD 测量 精确 到 像素 级 别 ， 
则 式 (1) 中 Xi 是 云图 像素 点 ， 面积 5; 为 1, | 于 云图 中 天 空 Hg amas 白色 ， Hz Eje 
厚 云 越 白 ， 即 云层 厚度 与 云 点 的 灰 度 值 呈 正比 ， 因 此 云层 厚度 w 由 灰 度 值 Vidc 


w, =V,/255 (3) 


其 中 Vi 的 取 值 范围 为 0~255。 综 合式 (1) (2) OD 可 得 到 基于 像素 的 ASICDD 计算 模型 


Netoud 
ASICDD = > (4) 
i=l 255 
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EHF, V 表示 云图 像素 值 ，d; 表示 该 像素 点 距 云 图 中 心 点 的 距离 ，Nuow 表示 云 点 总 数 。 计 
算 结果 进行 归 一 化 处 理 , 使 云 分 布 密度 值 映射 到 0-100 之 间 。 图 3 表示 Clear. Covered, Inner, 
Outer 四 类 云图 的 云 分 布 密度 的 分 布 情况 ， 可 以 看 出 各 类 云图 有 较 明 显 的 分 界 ， 说 明 云 分 布 
密度 可 作为 基于 云 量 的 云图 分 类 的 标准 。 


100 T 
+ 
80 
+ EN = 
Q 60 + | | 
a | | 
| | | 
v | | 
<= 40 | | 
+ | 
| 
02 | — | 2f t 一 
R-square=1 3- 
c AL. 
6 | | | 0 
0 01 02 03 04 05 06 07 Clear Covered — Tone? Outer 


di* 


图 2 距离 分 布 函 数 f 与 相对 距离 di* 的 关系 
Fig.2 The relationship between distance distribution 


function f and relative distance di*. 


图 3 四 类 云图 的 云 分 布 密度 分 布 
Fig.3 ASICDD of four categories of 
ASI images. 


1.2 云 面 积 计算 模型 

目前 国际 上 主要 是 针对 卫星 云图 根据 云 检测 得 到 的 云 像 元 ， 将 云 像 元 分 为 不 同 的 种 类 ， 
统计 计算 每 种 像 元 的 概率 ， 从 而 得 到 总 云 量 ， 以 此 反映 云层 的 覆盖 面积 。 计 算 的 方法 主要 有 
ISCCP、CLAVR-1、CLAVR-X、MODIS 等 。 本 文 在 CLAVR-X 的 基础 上 ， 以 云图 每 个 像素 
点 定义 云 面积 的 计算 模型 , 所 有 云 像素 点 的 加 权 面 积 和 与 整个 云图 有 效 区 域 的 面积 比 ,作为 
代表 云 面积 (Scloud) 的 指标 。 以 云层 厚度 作为 云 点 面积 权重 , 即 根据 灰 度 值 定义 权重 参数 ， 
灰 度 值 Vi 的 取 值 范围 为 0~255， 将 其 线性 划分 为 255 个 等 级 。 云 面积 计算 公式 如 式 (5) 所 
ZR, 其 中 Sgioba 是 云图 有 效 区 域 面 H, 以 像素 为 单位 ， 本 文中 是 Setobat= 1411x1411 像素 。 


Scloud = 一 (5) 
2555 


global 

2 基于 云 量 计算 的 云图 分 类 系统 

国内 已 有 关于 云图 自动 分 类 的 相关 研究 : 文献 [17] 结 合 卫星 云图 的 纹理 特征 和 光谱 特征 
采用 SVM 算法 实现 卫星 云图 的 自动 分 类 ; 文献 [18] 提 出 一 种 针对 全 天 相机 云图 的 云 量 自动 
计算 方法 ， 并 依据 TMT 判读 全 天 相机 云图 的 方法 对 云图 进行 自动 分 类 。 但 这 两 种 方法 没有 
对 全 天 相机 云图 的 云 量 特征 进行 深入 描述 .本文 以 云 分 布 密度 和 云 面积 来 描述 云图 的 云 量 特 
iE, 并 结合 机 器 学 习 算法 构建 基于 云 量 计算 的 云图 分 类 系统 , 图 4 是 自动 分 类 系统 的 流程 框 
图 。 云 图 经 去 噪 、 分 割 出 云 区 域 图 像 后 ， 在 此 基础 上 进行 云 量 的 数值 计算 ， 最 后 以 云 分 布 密 
度 和 云 面 积 为 特征 的 分 类 器 对 云图 进行 自动 分 类 。 


= : Cloud 
ASI M Cloud region CERE 
f Denoising . amount Classification 
images segmentation . 
calculation 
图 4 


云图 自动 分 类 系统 流程 图 
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Fig.4 Cloud map automatic classification system flow chart 


2.1 云图 去 噪 


Ale, AY LA) 5(a) (b). 
2.2 云图 分 割 


本 文采 用 Otsu 算法 进行 云 


云图 的 固定 噪声 5 会 影响 云 检测 的 准确 度 ， 进 而 影响 云 量 计算 和 云图 分 类 的 结果 。 本 
文 的 系统 主要 针对 严重 影响 云 检测 准确 度 的 两 种 噪声 一 一 星光 噪声 和 日 、 月 光 品 声 进行 云 医 


区 域 检 测 ， 云 区 域 标 记 为 1， 天 空 背 景 标记 为 0， 得 到 二 值 
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而 


像 ， 结 果 如 图 5(c) 所 示 。 在 此 基础 上 将 二 值 图像 与 原 


图 相 乘 可 分 割 出 云 区域 ， 然 后 将 分 割 
进行 灰 度 归 一 ， 消 除 云图 之 间 的 明暗 差异 ， 最 终 云 图 分 割 结 果 如 图 


D 


5(d) 所 示 。 


图 5 (a@) 原 医 


〈 灰 度 图 ) ; OFRER: (c) 云 区 域 检测 ，(d) 云 图 分 割 


Fig.5 (a) Original image (grayscale image); (b) Denoising image; (c) Cloud area detection; (d) Cloud 


2.3 云 量 计 算 


Segmentation. 


系统 在 云 区 域 分 割 的 基础 上 ,计算 每 张 云 图 的 ASICDD 和 Scloud, 作为 下 一 步 云 图 分 类 


的 特征 。 表 1 显示 了 数据 集 
中 部 分 云图 的 ASICDD 和 
Scloud, 图 6 展示 了 数据 集 
中 云图 的 两 个 指标 之 间 的 
KA, 图 中 离 差 (deviation) 
计算 公式 如 式 6 所 示 。 可 以 
看 出 ，ASICDD 和 Scloud 
在 整体 上 呈正 相关 , 经 统计 
76.44% 的 云图 数据 的 离 差 
在 0.1 以 内 , 93.78% 的 云图 
的 离 差 在 0.2 以 内 。 但 在 云 
较 少 (Scloud<0.3) 的 情况 
下 ， 二 者 并 非 严格 的 正 相 
R, 离 差 较 大 。 出现 Scloud 
较 高 但 ASICDD 较 低 的 情 
况 , 这 在 表 1 列举 出 的 样 例 
中 也 有 体现 。 这 正 是 由 于 云 
分 布 密度 的 计算 模型 中 加 
入 了 云 点 和 中 心 点 的 距离 
影响 : 云 面积 大 但 距 中 心 点 


远 ， 云 多 分 布 在 云图 边缘 ，ASICDD 值 低 ; 反之 ， 云 面积 小 人 
中 央 , 则 不 利于 天 文 观 测 , ASICDD 值 高 .ASICDD 和 Scloud JEU 
类 和 Outer 类 之 中 ， 可 能 会 


表 1 部 分 


云图 的 云 分 布 密度 和 云 对 


器 
A 


Table 1 ASICDD and Scloud value of some ASI images. 
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导致 这 两 类 之 间 的 误 判 。 


deviation =|Scloud — ASICDD/100 


ASICDD Scloud 


56.0984 0.5312 
59.594] 0.4799 
64.6411 0.5876 
75.2491 | 0.7054 
79.3264 0.7732 


云 距 中 心 点 近 ， 云 多 位 于 云图 
E 相 关 的 情况 多 出 现 于 Clear 


(6) 
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2.4 分 类 算法 
这 一 部 分 本 文采 用 了 SVM，KNN， 决 策 树 和 随机 森林 4 种 传统 算法 进行 分 类 测试 。 数 
据 集 中 训练 集 包 含 1056 张 ASI 图像， 其 中 有 206 张 Clear，489 张 Covered，199 张 Inner 和 
162 张 Outer。 另 外 455 张 ASI 图 像 用 作 E xe ? 
测试 集 , 包括 89 7K Clear, 207 YK Covered, edi AG 
785% Inner All 81 3% Outer. A IEF Python 0.8 f 
中 的 Scikit-learn (Sklearn) 对 ASI 图 像 进 7 
行 分 类 ， 将 计算 的 每 张 云 图 的 ASICDD 
和 Scloud 值 作为 分 类 特征 ， 训 练 集 用 于 
训练 4 个 分 类 器 , 结合 分 层 洗 牌 分 制 交 叉 
验证 训练 超 参 数 , 使 用 准确 率 (Accuracy) — 03) - 
作为 模型 评分 。 另 采用 文献 [17] 中 的 结合 o 
纹理 特征 与 SVM 的 方法 作对 比 ， EFK o 
E J Æ ERE (Gray-level Co-occurrence 0 


hy 


“le Clear 
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e * Inner 

© Outer 
deviation=0 
deviation=0.1 
— — —-deviation-0.15 
BEES deviation-0.2 


ASICDD/100 
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Matrix, GLCM ) 提取 图 像 的 灰 度 和 纹理 Scloud 

特征 ， 结 合 SVM 进行 云图 分 类 。 图 6 云 分 布 密度 和 云 面积 之 间 的 关系 
sie Mj 

3 实验 结果 分 析 Fig.6 The relationship of ASICDD and Scloud. 


实验 部 分 是 在 为 了 较 全 面 地 评价 本 
文 提出 的 基于 云 分 布 密度 和 云 面积 的 云 
图 自动 分 类 系统 的 分 类 效果 ， 本 文 以 分 类 准确 率 (Accuracy) 、 精 准 率 Cprecision) 、 召 回 
率 (recall) 和 Fl-score 作为 评判 指标 ， 在 测试 集 455 张 ASI 图 像 上 进行 自动 分 类 ， 并 与 国 
家 天 文 台 提供 的 人 工分 类 标签 作对 比 ， 以 人 工分 类 结果 为 准 , 评估 不 同 分 类 算法 在 各 类 云 医 
上 的 分 类 性 能 。 四 个 指标 的 定义 如 下 : 


Accuracy =(TP+TN)/(TP + FP+TN + FN) (7) 
precision = TP/(TP + FP) (8) 
recall = TP/(TP + FN) (9) 


7 
x precision x recall (10) 


Fl— score = 
precision + recall 

其 中 ，TP 表示 实 为 正 并 划分 为 正 的 样本 数 ，TN 表示 实 为 负 并 划分 为 负 的 样本 数 ，FP 
表示 实 为 负 却 划分 为 正 的 样本 数 ，FN 表示 实 为 正 却 划分 为 负 的 样本 数 。 测 试 集 上 的 预测 结 
RUK 2 所 示 。 可 以 看 出 ， 本 文 使 用 的 四 种 算法 在 各 类 云图 的 识别 准确 率 上 均 达 到 了 9096 
以 上 , 这 表明 本 文 提出 的 云 分 布 密度 和 云 面积 可 以 作为 可 信 的 云 量 指标 , 在 云图 自动 分 类 工 
作 中 展现 了 其 优良 性 。 总 体 准确 率 最 高 的 是 随机 森林 算法 ，Covered 和 Inner 达到 了 100% 准 
确 识别 。 但 Outer 类 准确 率 最 高 的 是 文献 [17] 中 的 方法 ， 本 文 提出 的 方法 很 容易 将 Outer 类 
误 判 为 Clear 类 .基于 GLCM 特征 提取 的 方法 在 Outer 类 的 识别 较 准 确 , 但 对 Clear 类 和 Inner 
类 的 识别 准确 度 较 差 ， 因 此 总 体 准确 率 不 如 本 文 提出 的 方法 。 
对 于 误 判 的 去 图， 进行 如 图 7 所 示 的 分 析 。 图 7(a) 是 人 工 判定 标签 为 Clear， 系 统 自 动 
识别 为 Clear 的 云图 ; 图 7(b) 是 人 工 判定 标签 为 Outer， 系 统 自动 识别 为 Clear 的 云图 〈 误 判 
云图 ) 。 可 以 看 出 ， 图 7(a)(b) 在 外 圈 以 内 均 有 云 存 在 ; 7(a) 中 云 较 薄 ， 分 布 较 分 散 ; 
7(b) 中 云 较 厚 ， 分布 较为 集中 。 这 就 导致 (a) 图 的 云 分 布 密度 和 云 面 积 值 均 大 于 (b) 图 ， 因 此 导 


致 系统 的 误 判 。 
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表 2 自动 分 类 准确 率 对 比 
Table 2 Comparison of accuracy of automatic classification results 
Clear Covered Inner 
0.9975 0.9807 0.9744 
0.9775 0.9872 
0.9975 1 
0.9975 1 
0.9318 0.9903 0.9744 


GLCM+SVM 
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图 7 云图 误 判 分 析 
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Fig.7 Misjudgment analysis of cloud images. 


实验 采用 精准 率 Cprecision) ~ HPZ (recall) 和 FI-score 对 分 类 结果 进行 评判 ， 表 3 


显示 了 四 种 分 类 器 的 分 类 
的 各 项 总 
在 本 文 的 自动 分 类 系统 中 的 分 类 


表 3 使 


H 


分 类 结果 评分 ， 总体 评 分 取样 本 的 宏 平 均 。 可 以 看 
评分 为 最 高 值 , 总 精准 率 达 到 98.41%, 总 召回 


率 和 了 Fl-score 评估 分 类 结果 


0.9753 


Outer 


0.5478 
0. 


0182 


Table 3 Using precision, recall, and F1-score to evaluate classification results 


Categories of cloud images 
SVM 
KNN 
precision Decision Tree 
Random Forest 
GLCM+SVM 
SVM 
KNN 
recall Decision Tree 
Random Forest 
GLCM+SVM 
SVM 
KNN 
Fl-score Decision Tree 
Random Forest 


GLCM+SVM 
4 结论 


本 文 的 创新 点 是 提出 了 一 个 计算 全 天 相机 云图 云 量 的 直观 可 信 的 数值 指标 


性 能 最 好 。 
用 精准 率 、 召 回 
Clear Covered 

0.9158 0.9902 
0.9355 0.9904 
0.9457 0.9857 
0.9667 0.9952 
0.9540 0.9951 
0.9775 0.9807 
0.9775 1 
0.9775 1 
0.9775 1 
0.9326 0.9903 
0.9457 0.9854 
0.9560 0.9952 
0.9613 0.9928 
0.9721 0.9976 
0.9432 0.9927 


密度 ， 并 基于 云 量 的 数值 特征 建立 云 
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rH 


文 测试 了 SVM，KNN， 决 策 树 和 随机 森林 4 种 传统 算法 
的 识别 准确 率 达 95% 以 上 。 但 是 还 存在 云图 误 判 的 情况 ， 需 要 进 
影响 云层 厚度 的 判断 ， 本 文 未 


DS 


类 云 


此 外 ,云图 的 光照 条 件 容 
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Inner 


0.9500 


0.9620 


Outer 
0.9733 
0.9737 
0.9733 
0.9747 
0.9634 
0.9012 
0.9136 
0.9012 
0.9506 
0.9753 
0.9359 
0.9427 
0.9359 
0.9625 
0.9693 


动 分 类 系统 ， 该 系统 实现 了 较 高 的 识 另 
E. Ë 


Total 
0.9648 
0.9780 
0.9780 
0.9868 
0.9736 


出 ， 随 机 森林 分 类 器 
3&3 $8] 98.296, 总 Fl-score 达到 98.3%, 


Total 
0.9573 
0.9749 
0.9762 
0.9841 
0.9656 
0.9584 
0.9696 
0.9697 
0.9820 
0.9681 
0.9573 
0.9719 
0.9725 
0.9830 
0.9668 
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其 中 随机 森林 的 准确 


率 更 高 ， 各 
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步 完善 计算 模型 。 
啊 。 因 


此 在 
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下 来 的 研究 中 需要 考虑 光照 的 影响 , 通过 去 噪 消除 光照 影响 , 或 是 建立 基于 光照 模型 的 云 量 
计算 模型 。 除 此 之 外 ， 还 可 以 结合 最 新 的 机 器 学 习 算法 完善 系统 ， 提 高 系统 的 识别 准确 率 。 
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A cloud cover measurement index based on all-sky imager 


Images 


Zhang Yuxin!, Qiu Bo', Shi Chaojun', Li Mengci’, Xiang Guanjie' 
(1.Hebei University of Technology, Tianjin, 300401) 


Abstract: All-sky imager (ASI) images are an important means for the astronomy community to 
monitor cloud cover at present, but there is no definite cloud cover calculation index. Therefore, 
this paper proposes a new quantitative index for cloud amount measurement--Cloud Distribution 
Density of ASI images (ASICDD), and establishes an automatic classification system for ASI 
images based on this index. Firstly, all the images in the dataset from the Key Laboratory of 
Optical Astronomy at the National Astronomical Observatories of Chinese Academy of Sciences 
(CAS) are denoised and the cloud area is segmented from the sky by OTSU algorithm. Secondly, 
the cloud amount for ASI image with the background remove is calculated by ASICDD proposed 
in this paper. Finally, we use four traditional classifiers (SVM, KNN, Decision Tree and Random 
Forest) to classify ASI images automatically according to the calculated value and evaluate the 
performance of each classifier. The results show that ASICDD can be used as a numerical index 
for judging the cloud cover of ASI images; the automatic ASI images classification system based 
on ASICDD achieves a high recognition accuracy rate. Meanwhile Random Forest has the best 
classification effect--the recognition accuracy rate of various cloud images has reached more than 
95%. 

Keywords: ASICDD; all-sky images; TMT; cloud cover measurement 


